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(57) Abstract: In order to obtain an integer trans- 
formation, which provides integer initial values, 
the TDAC (time domain alaising cancellation) 
function of an MCDT (modified discrete cosine 
transform) is executed explicitly in the lime domain 
before the forward transformation. In the event 
of overlapping windows, this leads to a Givcns 
rotation that can be represented by lifting matrices. 
Time-discrete sampled values of an audio signal are 
initially combined in pairs to form a vector in order 
to be sequentially subjected to the action of a lifting 
matrix after the other. According to the invention, 
a rounding step (20, 24, 28) is executed by using 
a lifting matrix after each multiplication (18, 22, 
26) of a vector whereby resulting only in integers 
on the output side. A spectral representation 
with integer spectral values can be obtained by 
transforming (14) the windowed integer sampled 
values with an integer transformation. The inverse 
imaging with an inverse rotation matrix and with 
corresponding inverse lifting matrices leads to 
a precise reconstruction. The inventive concept 
provides a loss-free transformation, which can 
be directly coupled to an entropy coder without 
quantization in order lo obtain a windowing method 
and transformation method that can be implemented 
advantageously with regard to hardware. 
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Zusammenfassune: Urn eine Ganzzahl-Transformaiion zu erhallen, die ganzzahlige Ausgangswerte liefert, wird die TDAC- 
F^reTner ^pYiSt in, Zeitbereich vor der Hin-Transformation ausgefuhrt. Bei uberlappenden Fenstem fUhrt^ z« 

rmeSen^Ro^on, die durch Lifting-Malrizen dargestellt werden kann, wobei z*i,diskre.e Abtastwerte ernes Aud,o*gnals zu- 
naThst p^eise zu einem Vektor zusammengefassi werden, um sequentiell mil einer Lirting-Malnx nach , der anderen beaufsehlagl 
rweSTrSdunesgemass wird nach jeder Multiplikauon (18, 22, 26) eines Vektors mil einer Li Hing-Malnx em Run dungs*hntt 
on S "sfdurcheeruhrL so dass sich ausgangsseitig lediglich Ganzzahlen ergeben. Durch Transformer*! (14) der gefensterten 
S'zzahl^AbSS St einer ganzzahligen Transformation kann eine spektrale DarsteHung mi, ^^fM 
en^icnVwerden Die inverse Abbilduna mit einer inversen Drehmatrix und entsprechenden inversen Lifling-Matrizen fiihrt zu emer 
Z^SESSZZ. erfindungsgemasse Konzept liefert eine vcrlusllose Transformation die «J^^33^J 
Star mil einem Entropie-Codierer gekoppell werden kann, um ein Fensierungs- und TransfonaaUons-Verfahren zu erhallen, das 
hardwaremassig gunstig implementiert werden kann. 
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Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten 

Audio-Abtastwerten 



5 Beschreibunq 

Die vorliegende Erfindung bezieht sich auf die Audiocodie- 
rung und insbesondere auf Verfahren und Vorrichtungen zum 
Verarbeiten von zeitdiskreten Audio-Abtastwerten, um ganz- 
10 zahlige Ausgangswerte zu erhalten. 

Moderne Audiocodierverf ahren, wie z. B. MPEG Layer3 (MP3) 
oder MPEG AAC verwenden Transf ormationen wie beispielsweise 
die sogenannte modifizierte diskrete Cosinustransf ormation 

15 (MDCT) , um eine blockweise Frequenzdarstellung eines Audio- 
signals zu erhalten. Ein solcher Audiocodierer erhalt ubli- 
cherweise einen Strom von zeitdiskreten Audio-Abtastwerten. 
Der Strom von Audio-Abtastwerten wird gefenstert, um einen 
gefensterten Block von beispielsweise 1024 oder 2048 gefen- 

20 sterten Audio-Abtastwerten zu erhalten. Zur Fensterung wer- 
den verschiedene Fensterf unktionen eingesetzt, wie z. B. 
ein Sinus-Fenster, etc. 

Die gefensterten zeitdiskreten Audio-Abtastwerte werden 
25 dann mittels einer Filterbank in eine spektrale Darstellung 
umgesetzt. Prinzipiell kann hierzu eine Fourier- 
Transformation, oder aus speziellen Grunden eine Abart der 
Fourier-Transformation, wie z. B. eine FFT oder, wie es 
ausgefuhrt worden ist, eine MDCT eingesetzt werden. Der 
30 Block von Audio-Spektralwerten am Ausgang der Filterbank 
kann dann je nach Bedarf weiter verarbeitet werden. Bei den 
oben bezeichneten Audio-Codierern folgt eine Quantisierung 
der Audio-Spektralwerte, wobei die Quantisierungsstuf en ty- 
pischerweise so gewahlt werden, daft das durch das Quanti- 
35 sieren eingefiihrt Quantisierungsrauschen unterhalb der psy- 
choakustischen Maskierungsschwelle liegt, d. h. "wegmas- 

mm mm • 

kiert n wird. Die Quantisierung ist eine verlustbehaf tete 
Codierung. Um eine weitere Datenmengenreduktion zu erhal- 
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ten, werden die quantisierten Spektralwerte anschliefiend 
beispielsweise mittels einer Huf fman-Codierung Entropie- 
codiert. Durch Hinzufiigen von Seiteninf ormationen, wie z. 
B. Skalenfaktoren etc. wird aus den Entropie-codierten 
5 quantisierten Spektralwerten mittels eines Bitstrom- 
Multiplexers ein Bitstrom gebildet, der gespeichert oder 
ubertragen werden kann . 

im Audio-Decodierer wird der Bitstrom mittels eines 
10 Bitstrom-Demultiplexers in codierte quantisierte Spektral- 
werte und Seiteninf ormationen aufgeteilt. Die Entropie- 
codierten quantisierten Spektralwerte werden zunachst 
Entropie-decodiert, um die quantisierten Spektralwerte zu 
erhalten. Die quantisierten Spektralwerte werden dann in- 
15 vers quantisiert, um decodierte Spektralwerte zu erhalten, 
die Quantisierungsrauschen aufweisen, das jedoch unterhalb 
der psychoakustischen Maskierungsschwelle liegt und daher 
unhorbar sein wird. Diese Spektralwerte werden dann mittels 
eines Synthese-Filterbank in eine zeitliche Darstellung um- 
20 gesetzt, um zeitdiskrete decodierte Audio-Abtastwerte zu 
erhalten. In der Synthese-Filterbank muli ein zum Transfor- 
mations-Algorithmus inverser Transf ormations-Algorithmus 
eingesetzt werden. AuJierdem mufi nach der Frequenz-Zeit- 
Riacktransformation das Fenstern riickgangig gemacht werden. 

Um eine gute Frequenzselektivitat zu erreichen, verwenden 
moderne Audio-Codierer typischerweise eine Block- 
Uberlappung. Ein solcher Fall ist in Fig. 4a dargestellt. 
Zunachst werden beispielsweise 2048 zeitdiskrete Audio- 
Abtastwerte genommen und mittels einer Einrichtung 402 ge- 
fenstert. Das Fenster, das die Einrichtung 402 verkorpert, 
hat eine Fensterlange von 2N Abtastwerten und liefert aus- 
gangsseitig einen Block von 2N gefensterten Abtastwerten. 
Um eine Fensteruberlappung zu erreichen, wird mittels einer 
Einrichtung 404, die lediglich aus Ubersichtlichkeitsgriin- 
den in Fig. 4a getrennt von der Einrichtung 402 dargestellt 
ist, ein zweiter Block von 2N gefensterten Abtastwerten ge- 
bildet. Die in die Einrichtung 404 eingespeisten 2048 Ab- 
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tastwerte sind jedoch nicht die an das erste Fenster unmit- 
telbar anschlieftenden zeitdiskreten Audio-Abtastwerte, son- 
dern beinhalten die zweite Halfte der durch die Einrichtung 
402 gefensterten Abtastwerte und beinhalten zusatzlich le- 
5 diglich 1024 "neue" Abtastwerte- Die Uberlappung ist durch 
eine Einrichtung 406 in Fig. 4a symbolisch dargestellt, die 
einen Oberlappungsgrad von 50% bewirkt. Sowohl die durch 
die Einrichtung 402 ausgegebenen 2N gefensterten Abtastwer- 
te als auch die durch die Einrichtung 404 ausgegebenen 2N 

10 gefensterten Abtastwerte werden dann mittels einer Einrich- 
tung 408 bzw. 410 dem MDCT-Algorithmus unterzogen. Die Ein- 
richtung 408 liefert gemaft dem bekannten MDCT-Algorithmus N 
Spektralwerte fur das erste Fenster, wahrend die Einrich- 
tung 410 ebenfalls N Spektralwerte liefert, jedoch fur das 

15 zweite Fenster, wobei zwischen dem ersten Fenster und dem 
zweiten Fenster eine Uberlappung von 50% besteht. 

Im Decodierer werden die N Spektralwerte des ersten Fen- 
sters, wie es in Fig. 4b gezeigt ist, einer Einrichtung 

20 412, die eine inverse modifizierte diskrete Cosinustrans- 
formation durchfiihrt, zugefuhrt. Dasselbe gilt fur die N 
Spektralwerte des zweiten Fensters . Diese werden einer Ein- 
richtung 414 zugefuhrt, die ebenfalls eine inverse modifi- 
zierte diskrete Cosinustransf ormation durchfuhrt. Sowohl 

25 die Einrichtung 412 als auch die Einrichtung 414 liefern 
jeweils 2N Abtastwerte fur das erste Fenster bzw. 2N Ab- 
tastwerte fur das zweite Fenster. 



30 



In einer Einrichtung 416, die in Fig. 4b mit TDAC (TDAC = 
Time Domain Aliasing Cancellation) bezeichnet ist, wird die 
Tatsache berucksichtigt , daft die beiden Fenster uberlappend 
sind. Insbesondere wird ein Abtastwert yi der zweiten Half- 
te des ersten Fensters, also mit einem Index N+k, mit einem 
Abtastwert y 2 aus der ersten Halfte des zweiten Fensters, 
35 also mit einem Index k summiert, so daft sich ausgangssei- 
tig, also im Decodierer, N decodierte zeitliche Abtastwerte 
ergeben . 
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Es sei darauf hingewiesen, daft durch die Funktion der Ein- 
richtung 416, die auch als Add-Funktion bezeichnet wird, 
die in den. durch Fig. 4a schematise* dargestellten Codierer 
durchgefuhrte Fensterung gewissermaften automatisch beriick- 
sichtigt wird, so daft in dem durch Fig. 4b dargestellten 
Decodierer keine explizite "inverse Fensterung" stattzufin- 
den hat . 

Wenn die durch die Einrichtung 402 oder 404 implementierte 
Fensterfunktion mit w(k) bezeichnet wird, wobei der Index k 
den Zeitindex darstellt, bezeichnet wird, so muft die Bedin- 
gung erfiillt sein, dali das Fenstergewicht w(k) im Quadrat 
addiert zu dem Fenstergewicht w(N+k) im Quadrat zusammen 1 
ergibt, wobei k von 0 bis N-l lauft. Wenn ein Sinus-Fenster 
15 verwendet wird, dessen Fenster-Gewichtungen der ersten 
Halbwelle der Sinus-Funktion folgen, so ist diese Bedingung 
immer erfiillt, da das Quadrat des Sinus und das Quadrat des 
Cosinus fur jeden Winkel zusammen den Wert 1 ergeben. 



10 



20 



25 



30 
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Nachteilig an dem in Fig. 4a beschriebenen Fenster- 
Verfahren mit anschlieftender MDCT-Funktion ist die Tatsa- 
che, daft die Fensterung durch Multiplikation eines zeitdis- 
kreten Abtastwerts, wenn an ein Sinus-Fenster gedacht wird, 
mit einer Gleitkommazahl erreicht wird, da der Sinus eines 
Winkels zwischen 0 und 180 Grad abgesehen von dem Winkel 90 
Grad keine Ganzzahl ergibt. Auch wenn ganzzahlige zeitdis- 
krete Abtastwerte gefenstert werden, entstehen nach dem 
Fenstern also Gleitkommazahlen . 

Daher ist, auch wenn kein psychoakustischer Codierer ver- 
wendet wird, d. h. wenn eine verlustlose Codierung erreicht 
werden soli, am Ausgang der Einrichtungen 408 bzw. 410 eine 
Quantisierung notwendig, urn eine einigermalJen uberschaubare 
Entropie-Codierung durchfuhren zu konnen. 

Wenn also bekannte Transformationen, wie sie anhand von 
Fig. 4a betrieben worden sind, fur ein verlustloses Audio- 
codieren eingesetzt werden soil, muft entweder eine sehr 
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feine Quantisierung eingesetzt werden, um den resultieren- 
den Fehler aufgrund der Rundung der Gleitkommazahlen ver- 
nachlassigen zu konnen, oder das Fehlersignal muB zusatz- 
lich beispielsweise im Zeitbereich codiert werden. 

5 

Ferner haben digitale Signalprozessoren iiblicherweise einen 
Akkumulator mit groiJerer Wortlange als die iibliche Opera- 
torlange, um zu viele Rundungsoperationen zu vermeiden. Die 
Verwendung von schnellen Algorithmen fur die Implementation 

10 einer Filterbank fiihrt typischerweise zu dem Bedarf, Zwi- 
schenergebnisse zu speichern, die in spateren Schritten 
verwendet werden sollen. Die Zwischenergebnisse miissen auf 
die Operatorgenauigkeit gerundet werden oder miissen in zwei 
Speicheroperationen aufgeteilt werden. Typischerweise akku- 

15 mulieren sich die Rundungsf ehler mehrerer Verarbeitungs- 
schritte. Wenn ferner beriicksichtigt wird, dafc die meisten 
Gleitkomma-DSPs eine Wortlange von 32 Bit mit einer Mantis- 
se von nur 24 Bit haben, ist es of f ensichtlich, was mit 
Eingangssignalen mit einer Genauigkeit von 24 Bit passiert. 

20 

Sowohl eine zu feine Quantisierung als auch das zusatzliche 
Codieren des Fehlersignals als Alternative resultieren in 
einem Codierer mit erhohtem Rechenauf wand und erhohter Kom- 
plexitat, und damit auch in einem entsprechend aufwendige- 

25 ren Decodierer. Insbesondere der Decodierer, der, wenn an 
die Verbreitung von Musik beispielsweise uber das Internet 
gedacht wird, ein Massenprodukt ist, muii aufgrund dieser 
Tatsache preisgunstig sein, um sich gegenuber anderen Co- 
dierern am Markt durchsetzen zu konnen. Mit dieser Anforde- 

30 rung ist es oftmals nicht vereinbar, eine sehr feine Quan- 
tisierung zu verwenden oder ein zusatzliches Fehlersignal 
zu codieren, da der zusatzliche Mehraufwand zu hoheren De- 
codiererkosten fiihrt . 

35 Gleichzeitig ist es auf Codiererseite auf dem konkurrenzin- 
tensiven Markt fur Audiocodierer oftmals nicht tolerabel, 
zu groBe Datenmengen zu erzeugen. In anderen Worten ausge- 
druckt ist es von wesentlicher Bedeutung, einen moglichst 



BNSDOCID: <WO 021036S4A1.I. > 



WO 02/103684 



6 



PCT/EP02/05865 



hohen Kompressionsfaktor zu erreichen, da oftmals Bandbrei- 
te-begrenzte Netze existieren, welche dazu fiihren, daB ein 
zu gering komprimiertes Audiostuck eine zu groBe Ubertra- 
gungsdauer iiber ein solches Netz hat, was beim Kunden un- 
mittelbar dazu fvihrt, daB er sich fur ein anderes Produkt 
mit hoherer Datenkompression und damit geringerer Obertra- 
gungszeit entscheidet . 

Die Aufgabe der vorliegenden Erfindung besteht darin, ein 
Codierer/Decodiererkonzept zu schaffen, das fur die ver- 
lustlose Codierung ceeignet ist und gleichzeitig eine hone 
Datenkomprimierung bei vertretbarem Aufwand liefert. 

Diese Aufgabe wird durch ein Verfahren zum Verarbeiten von 
zeitdiskreten Audio-Abtastwerten nach Patentanspruch 1, 
durch ein Verfahren zum invers-Verarbeiten von ganzzahligen 
Werten nach Patentanspruch 17, durch eine Vorrichtung zum 
Verarbeiten von zeitdiskreten Audio-Abtastwerten nach Pa- 
tentanspruch 22 Oder durch eine Vorrichtung zum Invers- 
Verarbeiten von ganzzahligen Werten nach Patentanspruch 23 
gelost . 

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, 
daB das Entstehen von Gleitkommawerten im Schritt des Fen- 
sterns dadurch vermieden werden kann, wenn die TDAC- 
Operation explizit im Zeitbereich, d. h. vor dem Ausfuhren 
einer Transformation, durchgefuhrt wird. Dies wird dadurch 
erreicht, daB im Gegensatz zum Stand der Technik bereits 
vor der Transformation die Uberlappung beriicksichtigt wird, 
und zwei zeitdiskrete Abtastwerte aus unterschiedlichen 
Vierteln eines Fensters verarbeitet werden. Die Verarbei- 
tung findet dadurch statt, daB der Vektor der zwei zeitdis- 
kreten Abtastwerte aus unterschiedlichen Vierteln des Fen- 
sters mit einer Drehmatrix beaufschlagt werden, wobei die 
Drehmatrix durch eine Mehrzahl von sogenannten Lifting- 
Matrizen darstellbar ist. Wie es bekannt ist, zeichnen sich 
Lifting-Matrizen dadurch aus, daB sie lediglich ein Element 
haben, das ungleich "0" oder "1" ist, d. h. das nicht- 



02103684A1_L> 



WO 02/103684 



7 



PCT/EP02/05865 



ganzzahlig ist. Durch sequentielles Ausfiihren einer Multi- 
plikation einer Lifting-Matrix mit dem Vektor von zeitdis- 
kreten Abtastwerten und anschlieBendes Runden der Komponen- 
te des Vektors, die nicht-ganzzahlig ist, werden Gleitkom- 
5 mazahlen unmittelbar nach ihrer Entstehung gleich gerundet. 
Es sei darauf hingewiesen, dafi aufgrund der beschriebenen 
Eigenschaft der Lif ting-Matrizen immer nur eine Komponente 
des Ergebnisvektors der Mul tiplikation gerundet werden mufc . 

10 Vorzugsweise ist die Drehmatrix eine Givens-Drehmatrix, 
die, wie es bekannt ist, durch drei Lif ting-Matrizen dar- 
stellbar ist. Der Drehwinkel der Givens-Drehmatrix hangt 
von der Fensterf unktion ab. Es sei darauf hingewiesen, dafi 
fur das erf indungsgemafie Verfahren samtliche Fensterfunk- 

15 tionen zulassig sind, so lange diese Fensterf unktionen die 
beschriebene Bedingung erfullen, daB das Quadrat eines Fen- 
stergewichts und das Quadrat eines um N Fenstergewichte 
zeitlich entfernten Fenstergewichts zusammen den Wert 1 er- 
geben. Es sei darauf hingewiesen, dali diese Bedingung auch 

20 durch zwei auf einanderf olgende Fenster unterschiedlicher 
Form, wie z. B. ein Sinus-Fenster und ein Kaiser-Bessel- 
Fenster, erfullt sein kann. 

Bei einem bevorzugten Ausf iihrungsbeispiel der vorliegenden 
25 Erfindung wird die MDCT-Verarbeitung mit 50%iger Uberlap- 
pung durch Lif ting-Matrizen und Rundungen und eine an- 
schlieliende diskrete Cosinustransf ormation (DCT) mit nicht- 
symmetrischen Basisf unktionen, d. h. durch eine DCT vom Typ 
IV, ersetzt . 

30 

Um nicht nur eine ganzzahlige Fensterung sondern auch eine 
ganzzahlige diskrete Cosinustransf ormation zu erreichen, 
wird es ferner bevorzugt, auch die DCT-Transf ormation durch 
Givens-Rotationen und insbesondere durch Verarbeitung mit 
35 Lifting-Matrizen und Rundung nach jeder Lifting-Matrix- 
Multiplikation zu ersetzen. 
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Ein Vorteil der vorliegenden Erfindung besteht darin / daft 
nunmehr entweder beim Fenstern oder beim kompletten Trans- 
formieren die Ausgangswerte, also die gefensterten Ab- 
tastwerte oder die Spektralwerte ganzzahlig bleiben. Den- 
5 noch ist der gesamte ProzeB umkehrbar, indem einfach die 
inversen Rotationen in umgekehrter Reihenfolge bezuglich 
der Verarbeitung der Lif ting-Matrizen und dieselbe Run- 
dungsf unktion eingesetzt werden. Das erf indungsgemaBe Kon- 
zept eignet sich somit als ganzzahlige Approximierung der 
10 MDCT mit perfekter Rekonstruierbarkeit und stellt somit ei- 
ne ganzzahlige modifizierte diskrete Cosinustransf ormation 
(INT MDCT) dar. 

Das erf indungsgemaBe Konzept hat nach wie vor die gunstigen 

15 Eigenschaf ten der MDCT, d. h. eine uberlappende Struktur, 
die eine bessere Frequenzselektivitat als nicht- 
uberlappende Blocktransf ormationen liefert, und eine kriti- 
sche Abtastung, so daB die Gesamtanzahl von Spektralwerten, 
die ein Audiosignal darstellen, nicht die Anzahl von Ein- 

20 gangs-Abtastwerten uberschreitet . So werden zwar aufgrund 
der Rundungen in den Rotationsschritten Nichtlinearitaten 
eingefuhrt. Die Rundungen fuhren jedoch gleichzeitig dazu, 
daB der Zahlenbereich der ganzzahligen Spektralwerte den 
Zahlenbereich der Eingangswerte nicht wesentlich uber- 

25 schreitet. Obgleich aufgrund der uberlappenden Struktur ei- 
ne Energieerhaltung auf einer Block-um-Block-Basis, wie sie 
durch das Parsevalsche Theorem gegeben ist, nicht vorliegt, 
zeichnet sich die erf indungsgemalie ganzzahlige MDCT dadurch 
aus, daB die mittlere Energie pro Block beibehalten wird, 

30 da vorzugsweise lediglich gerundete Givens-Rotationen ein- 
gesetzt werden, die im allgemeinen energieerhaltend sind. 

Ein Vorteil der vorliegenden Erfindung besteht ferner dar- 
in, daft aufgrund der Tatsache, daft ganzzahlige Ausgangswer- 
35 te vorliegen, auf eine anschliefcende Quantisierung verzich- 
tet werden kann, derart, daB die Ausgangswerte der ganzzah- 
ligen MDCT unmittelbar Entropie-codiert werden konnen, urn 
einen verlustlosen Datenkomprimierer zu erhalten. 
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Bevorzugte Ausf uhrungsbeispiele der vorliegenden Erfindung 
werden nachfolgend Bezug nehmend auf die beiliegenden 
Zeichnungen detailliert erlautert. Es zeigen: 

5 

Fig. 1 ein Blockschal tbild einer erf indungsgemaflen Vor- 

richtung zum Verarbeiten von zeitdiskreten Audio- 
Abtastwerten, urn ganzzahlige Werte zu erhalten; 



10 Fig. 2 eine schematische Darstellung der Zerlegung einer 

MDCT und einer inversen MDCT in Givens-Rotationen 
und zwei DCT-IV-Operationen gemafi einem bevorzug- 
ten Ausfuhrungsbeispiel der vorliegenden Erfin- 
dung; 

15 

Fig. 3 eine Darstellung zur Veranschaulichung der Zerle- 
gung der MDCT mit 50-Prozent-Uberlappung in Rota- 
tionen und DCT-IV-Operationen; 

20 Fig. 4a ein schematisches Blockschaltbild eines bekannten 

Codierers mit MDCT und 50 Prozent Uberlappung; 
und 

Fig. 4b ein Blockschaltbild eines bekannten Decodierers 
25 zum Decodieren der durch Fig. 4a erzeugten Werte, 

Fig. 1 zeigt ein Ubersichtsdiagramm fur die erf indungsgema- 
fte Vorrichtung bzw. das erf indungsgemafte Verfahren zum Ver- 
arbeiten von zeitdiskreten Abtastwerten, die ein Audiosi- 

30 gnal darstellen, urn ganzzahlige Werte zu erhalten. Die 
zeitdiskreten Abtastwerte werden durch die in Fig. 1 ge- 
zeigte Vorrichtung gefenstert und optional in eine spektra- 
le Darstellung umgesetzt. Die zeitdiskreten Abtastwerte, 
die an einem Eingang 10 in die Vorrichtung eingespeist wer- 

35 den, werden mit einem Fenster w mit einer Lange, die 2N 
zeitdiskreten Abtastwerten entspricht, gefenstert, urn an 
einem Ausgang 12 ganzzahlige gefensterte Abtastwerte zu er- 
reichen, welche dazu geeignet sind, urn mittels einer Trans- 
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formation und insbesondere der Einrichtung 14 zum Ausfuhren 
einer ganzzahligen DCT in eine spektrale Darstellung umge- 
setzt zu werden. Die ganzzahlige DCT ist ausgebildet, um 
aus N Eingangswerten N Ausgangswerte zu erzeugen, was im 
5 Gegensatz zu der MDCT-Funktion 4 08 von Fig. 4a steht, die 
aus 2N gefensterten Abtastwerten aufgrund der MDCT- 
Gleichung lediglich N Spektralwerte erzeugt. 

Zum Fenstern der zeitdiskreten Abtastwerte werden zunachst 
10 in einer Einrichtung 16 zwei zeitdiskrete Abtastwerte aus- 
gewahlt, die zusammen einen Vektor von zeitdiskreten Ab- 
tastwerten darstellen. Ein zeitdiskreter Abtastwert, der 
durch die Einrichtung 16 ausgewahlt wird, liegt im ersten 
Viertel des Fensters. Der andere zeitdiskrete Abtastwert 
15 liegt in dem zweiten Viertel des Fensters, wie es anhand 
von Fig. 3 noch detaillierter ausgefuhrt wird. Der durch 
die Einrichtung 16 erzeugte Vektor wird nunmehr mit einer 
Drehmatrix der Dimension 2x2 beauf schlagt, wobei diese 
Operation nicht unmittelbar durchgefuhrt wird, sondern mit- 
20 tels mehrerer sogenannten Lif ting-Matrizen . 

Eine Lifting-Matrix hat die Eigenschaft, daB sie nur ein 
Element aufweist, das von dem Fenster w abhangt und un- 
gleich "1" oder "0" ist. 

25 

Die Faktorisierung von Wavelet-Transf ormationen in Lifting- 
Schritte ist in der Fachverof f entlichung "Factoring Wavlet 
Transforms Into Lifting Steps", Ingrid Daubechies und Wim 
Sweldens, Preprint, Bell Laboratories, Lucent Technologies, 

30 1996, dargestellt. Allgemein ist ein Lifting-Schema eine 
einfache Beziehung zwischen perfekt rekonstruierenden Fil- 
terpaaren, die dasselbe Tiefpafl- oder HochpafJf ilter haben . 
Jedes Paar komplementarer Filter kann in Lif ting-Schritte 
faktorisiert werden. Insbesondere gilt dies fur Givens- 

35 Rotationen. Es sei der Fall betrachtet, bei dem die Poly- 
phasenmatrix eine Givens-Rotation ist. Es gilt dann: 
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Jede der drei rechts des Gleichheitszeichens stehenden Lif- 
ting-Ma tri2en hat als Hauptdiagonalelemente den Wert "1" . 
5 Ferner ist in jeder Lifting-Matrix ein Nebendiagonalelement 
gleich 0, und ein Nebendiagonalelement vom Drehwinkel a 
abhangig. 

Der Vektor wird nunmehr mit der dritten Lifting-Matrix, d. 

10 h. der Lif tingmatrix ganz rechts in obiger Gleichung, mul- 
tipliziert, urn einen ersten Ergebnisvektor zu erhalten. 
Dies ist in Fig. 1 durch eine Einrichtung 18 dargestellt. 
Erf indungsgemafi wird nunmehr der erste Ergebnisvektor mit 
einer beliebigen Rundungsf unktion, die die Menge der reel- 

15 len Zahlen in die Menge der ganzen Zahlen abbildet, gerun- 
det, wie es in Fig. 1 durch eine Einrichtung 20 dargestellt 
ist. Am Ausgang der Einrichtung 20 wird ein gerundeter er- 
ster Ergebnisvektor erhalten. Der gerundete erste Ergebnis- 
vektor wird nunmehr in eine Einrichtung 22 zum Multiplizie- 

20 ren desselben mit der mittleren, d. h. zweiten, Lifting- 
Matrix eingespeist, urn einen zweiten Ergebnisvektor zu er- 
halten, der in einer Einrichtung 24 wiederum gerundet wird, 
urn einen gerundeten zweiten Ergebnisvektor zu erhalten. Der 
gerundete zweite Ergebnisvektor wird nunmehr in eine Ein- 

25 richtung 26 eingespeist, und zwar zum Multiplizieren des- 
selben mit der links in der obigen Gleichung auf gef iihrten, 
d. h. ersten, Lif tingmatrix, urn einen dritten Ergebnisvek- 
tor zu erhalten, der schlieftlich noch mittels einer Ein- 
richtung 28 gerundet wird, urn schlieJJlich an dem Ausgang 12 

30 ganzzahlige gefensterte Abtastwerte zu erhalten, die nun, 
wenn eine spektrale Darstellung derselben gewiinscht wird, 
durch die Einrichtung 14 verarbeitet werden mussen, urn an 
einem Spektralausgang 30 ganzzahlige Spektralwerte zu er- 
halten . 

35 

Vorzugsweise ist die Einrichtung 14 als Ganzzahl-DCT oder 
Integer-DCT ausgefvihrt. 
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Die diskrete Cosinus-Transf ormation gemaft Typ 4 (DCT-IV) 
mit einer Lange N ist durch folgende Gleichung gegeben : 



Die Koef fizienten der DCT-IV bilden eine orthonormale N x N 
Matrix. Jede orthogonale N x N-Matrix kann in N (N-D/2 Gi- 
vens-Rotationen zerlegt werden, wie es in der Fachverof- 
fentlichung P. P. Vaidyanathan, "Multirate Systems And Fil- 
10 ter Banks", Prentice Hall, Englewood Cliffs, 1993, ausge- 
fiihrt ist. Es sei darauf hingewiesen, dafi auch weitere Zer- 
legungen existieren . 

Bezuglich der Klassif ikationen der verschiedenen DCT- 

15 Algorithmen sei auf H. S. Malvar, "Signal Processing With 
Lapped Transforms", Artech House, 1992, verwiesen. Allge- 
mein unterscheiden sich die DCT-Algorithmen durch die Art 
ihrer Basisf unktionen . Wahrend die DCT-IV, die bei der vor- 
liegenden Erfindung bevorzugt wird, nicht-symmetrische Ba- 

20 sisf unktionen umfafit, d. h. eine Cosinus-Viertelwelle, eine 
Cosinus-3/4-Welle, eine Cosinus-5/4-Welle, eine Co$inus- 
7/4-Welle, etc., hat die diskrete Cosinustransf ormation z. 
B. vom Typ II (DCT-II) , achsensymmetrische und punktsymme- 
trische Basisf unktionen . Die 0-te Basisf unktion hat einen 

25 Gleichanteil, die erste Basisf unktion ist eine halbe Cosi- 
nuswelle, die zweite Basisf unktion ist eine ganze Cosinus- 
welle, usw. Aufgrund der Tatsache, dafi die DCT-II den 
Gleichanteil besonders berucksichtigt , wird sie bei der Vi- 
deocodierung verwendet, nicht aber bei der Audiocodierung, 

30 da bei der Audiocodierung im Gegensatz zur Videocodierung 
der Gleichanteil nicht von Relevanz ist. 

Im nachfolgend wird darauf eingegangen, wie der Drehwinkel 
a der Givens-Rotation von der Fensterf unktion abhangt . 

35 

Eine MDCT mit einer Fensterlange von 2N kann in eine dis- 
krete Cosinustransformation vom Typ IV mit einer Lange N 
reduziert werden. Dies wird dadurch erreicht, dafi die TDAC- 
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Operation explizit im Zeitbereich durchgefuhrt wird, und 
daft dann die DCT-IV angewandt wird. Bei einer 50%igen Ober- 
lappung iiberlappt die linke Halfte des Fensters fur einen 
Block t mit der rechten Halfte des vorausgehenden Blocks, 
5 d. h. des Blocks t-1. Der uberlappende Teil zwei aufeinan- 
derfolgender Blocke t-1 und t wird im Zeitbereich, d. h. 
vor der Transformation, f olgendermalien vorverarbeitet, d. 
h. zwischen dem Eingang 10 und dem Ausgang 12 von Fig. 1 
verarbeitet : 



( 




-i-*) ™(f +*) ) U(f - 1 - fc) 1 

15 Die mit der Tilde bezeichneten Werte sind die Werte am Aus- 
gang 12 von Fig. 1, wahrend die ohne Tilde in der obigen 
Gleichung bezeichnete x Werte die Werte am Eingang 10 bzw. 
hinter der Einrichtung 16 zum Auswahlen sind. Der Laufindex 
k lauft von 0 bis N/2-1, wahrend w die Fensterf unkt ion dar- 

20 stellt. 



25 



Aus der TDAC-Bedingung fUr die Fensterf unktion w gilt fol 
gender Zusammenhang : 



"(y+*) a +«,(f - 1-*) 2 = i 



Fur bestimmte Winkel a*, k = 0, N/2-1 kann diese Vor- 

30 verarbeitung im Zeitbereich als Gi vens-Rotation geschrieben 
werden, wie es ausgefuhrt worden ist. 

Der Winkel a der Givens-Rotation hangt f olgendermalien von 
der Fensterf unktion w ab: 

35 

a « arctan[w(N/2-l-k) / w(N/2 + k) ] 
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Es sei darauf hingewiesen, daJi beliebige Fensterf unktionen 
w eingesetzt werden konnen, solange sie diese TDAC- 
Bedingung erf iillen . 

5 Im nachf olgenden wird anhand von Fig. 2 ein kaskadierter 
Codierer und Decodierer beschrieben. Die zeitdiskreten Ab- 
tastwerte x(0) bis x(2N-l), die durch ein Fenster gemeinsam 
"gefenstert" werden, werden zunachst derart durch die Ein- 
richtung 16 von Fig. 1 ausgewahlt, dafi der Abtastwert x(0) 

10 und der Abtastwert x(N-l), d. h. ein Abtastwert aus dem er- 
sten Viertel des Fensters und ein Abtastwert aus dem zwei- 
ten Viertel des Fensters, ausgewahlt werden, um den Vektor 
am Ausgang der Einrichtung 16 zu bilden. Die sich uberkreu- 
zenden Pfeile stellen schematisch die Lifting- 

15 Multiplikationen und anschliefienden Rundungen der Einrich- 
tungen 18, 20 bzw. 22, 24 bzw. 26, 28 dar, um am Eingang 
der DCT-IV-B16cke die ganzzahligen gefensterten Abtastwerte 
zu erhalten. 

20 Wenn der erste Vektor wie oben beschrieben verarbeitet ist, 
wird ferner ein zweiter Vektor aus den Abtastwerten x(N/2- 
1) und x(N/2), d. h. wieder ein Abtastwert aus dem ersten 
Viertel des Fenster und ein Abtastwert aus dem zweiten 
Viertel des Fensters, ausgewahlt und wiederum durch den in 

25 Fig. 1 beschriebenen Algorithmus verarbeitet. Analog dazu 
werden samtliche anderen Abtastwertpaare aus dem ersten und 
zweiten Viertel des Fensters bearbeitet. Die selbe Verar- 
beitung wird fur das dritte und vierte Viertel des ersten 
Fensters durchgef uhrt . Nunmehr liegen am Ausgang 12 2N ge- 

30 fensterte ganzzahlige Abtastwerte vor, die nunmehr so, wie 
es in Fig. 2 dargestellt ist, in eine DCT-IV-Transformation 
eingespeist werden. Insbesondere werden die ganzzahligen 
gefensterten Abtastwerte des zweiten und dritten Viertels 
in eine DCT eingespeist. Die gefensterten ganzzahligen Ab- 

35 tastwerte des ersten Viertels des Fensters werden in eine 
vorausgehende DCT-IV zusammen mit den gefensterten ganzzah- 
ligen Abtastwerten des vierten Viertels des vorausgehenden 
Fensters verarbeitet. Analog dazu wird das vierte Viertel 
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der gefensterten ganzzahligen Abtastwerte in Fig. 2 mit dem 
ersten Viertel des nachsten Fensters zusammen in eine DCT- 
IV-Transf ormation eingespeist. Die mittlere in Fig. 2 ge- 
zeigte ganzzahlige DCT-IV-Transf ormation 32 liefert nunmehr 
5 N ganzzahlige Spektralwerte y(0) bis y(N-l). Diese ganzzah- 
ligen Spektralwerte konnen nunmehr beispielsweise einfach 
Entropie-codiert werden, ohne daft eine dazwischenliegende 
Quantisierung erforderlich ist, da die erf indungsgemafie 
Fensterung und Transformation ganzzahlige Ausgangswerte 
10 liefert. 

In der rechten Halfte von Fig. 2 ist ein Decodierer darge- 
stellt. Der Decodierer bestehend aus Rucktransf ormation und 
"inverser Fensterung" arbeitet invers zum Codierer. Es ist 

15 bekannt, daft zur Rucktransf ormation einer DCT-IV eine in- 
verse DCT-IV verwendet werden kann, wie es in Fig. 2 darge- 
stellt ist. Die Ausgangswerte der Decodierer-DCT-IV 34 wer- 
den nunmehr, wie es in Fig. 2 dargestellt ist, mit den ent- 
sprechenden Werten der vorausgehenden Transformation bzw. 

20 der nachf olgenden Transformation gemaft der vorliegenden Er- 
findung invers verarbeitet, urn aus den ganzzahligen gefen- 
sterten Abtastwerten am Ausgang der Einrichtung 34 bzw. der 
vorausgehenden und nachf olgenden Transformation wieder 
zeitdiskrete Audio-Abtastwerte x(0) bis x(2N-l) zu erzeu- 

25 gen. 

Die ausgangsseitige Operation geschieht erf indungsgemafi 
durch eine inverse Givens-Rotation, d. h. derart, daft die 
Blocke 26, 28 bzw. 22, 24 bzw. 18, 20 in der entgegenge- 

30 setzten Richtung durchlaufen werden. Dies sei anhand der 
zweiten Lifting-Matrix von Gleichung 1 naher dargestellt. 
Wenn (im Codierer) der zweite Ergebnisvektor durch Multi- 
plikation des gerundeten ersten Ergebnisvektors mit der 
zweiten Lif tingmatrix (Einrichtung 22) gebildet wird, so 

35 ergibt sich folgender Ausdruck: 

(x t y)-^(x.y + xsina) 
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Die Werte x, y auf der rechten Seite von Gleichung 6 sind 
Ganzzahlen. Dies trifft jedoch fur den Wert x sin a nicht 
zu. Hier muft die Rundungsf unktion r eingefuhrt werden, wie 
5 es in der nachf olgenden Gleichung 

fa, y) *-+ (x, y + r (x sin cc)) 

10 

dargestellt ist. Diese Operation fuhrt die Einrichtung 24 
aus . 

Die inverse Abbildung (im Decodierer) ist f olgendermafien 
15 definiert: 

(x\ y') ^ (x\ y' - r(x' sin a)) 

20 

Aufgrund dem Minuszeichens vor der Rundungsoperation wird 
ersichtlich, dali die ganzzahlige Approximierung des Lif- 
ting-Schritts umgekehrt werden kann, ohne daB ein Fehler 
eingefuhrt wird. Die Anwendung dieser Approximation auf je- 

25 den der drei Lif ting-Schritte fiihrt zu einer ganzzahligen 
Approximation der Givens-Rotation. Die gerundete Rotation 
(im Codierer) kann umgekehrt werden (im Decodierer) , ohne 
daft ein Fehler eingefuhrt wird, und zwar indem die inversen 
gerundeten Lif ting-Schritte in umgekehrter Reihenfolge 

30 durchlaufen werden, d. h. wenn beim Decodieren der Algo- 
rithmus von Fig, 1 von unten nach oben durchgefuhrt wird. 

Wenn die Rundungsf unktion r punktsymmetrisch ist, ist die 
inverse gerundete Rotation identisch zu der gerundeten Ro- 
35 tation mit dem Winkel -a und lautet f olgendermaften : 

/ cos ol sin a 
I — sin cr cos a 
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Die Lif ting-Matrizen fur den Decodierer , d. h. fur die in- 
verse Givens-Rotation, ergibt sich in diesem Fall unmittel- 
5 bar aus Gleichung (1), indem lediglich der Ausdruck "sin 
a" durch den Ausdruck "-sin a" ersetzt wird. 

Im nachf olgenden wird anhand von Fig. 3 noch einmal die 
Zerlegung einer ublichen MDCT mit uberlappenden Fenstern 40 

10 bis 46 dargelegt. Die Fenster 40 bis 46 uberlappen jeweils 
zu 50%. Pro Fenster werden zunachst Givens-Rotationen in- 
nerhalb des ersten und zweiten Viertels eines Fensters bzw. 
innerhalb des dritten und vierten Viertels eines Fensters 
ausgefiihrt, wie es durch die Pfeile 48 schematisch darge- 

15 stellt ist. Dann werden die rotierten Werte, d. h. die ge- 
fensterten ganzzahligen Abtastwerte derart in eine N-zu-N- 
DCT eingespeist, dafi immer das zweite und dritte Viertel 
eines Fensters bzw. das vierte und erste Viertel eines dar- 
auffolgenden Fensters gemeinsam mittels eines DCT-IV- 

20 Algorithmus in eine spektrale Darstellung umgesetzt wird. 

Erf indungsgemafl werden daher die ublichen Givens-Rotation 
in Lif ting-Matrizen zerlegt, die sequentiell ausgefiihrt 
werden, wobei nach jeder Lif ting-Matrix-Multiplikation ein 
25 Rundungsschritt eingefuhrt wird, derart, daJJ die Gleitkom- 
ma-Zahlen unmittelbar nach ihrer Entstehung gerundet wer- 
den, derart, dafl vor jeder Multiplikation eines Ergebnis- 
vektors mit einer Lifting-Matrix der Ergebnisvektor ledig- 
lich Ganzzahlen hat. 

30 

Die Ausgangswerte bleiben also immer ganzzahlig, wobei es 
bevorzugt wird, auch ganzzahlige Eingangswerte zu verwen- 
den. Dies stellt keine Einschrankung dar, da jegliche bei- 
spielsweise PCM-Abtastwerte, wie sie auf einer CD abgespei- 
35 chert sind, ganzzahlige Zahlenwerte sind, deren Wertebe- 
reich je nach Bitbreite variiert, d. h. abhangig davon, ob 

mm v • 

die zeitdiskreten digitalen Eingangswerte 16-Bit-Werte oder 
24-Bit-Werte sind. Dennoch ist, wie es ausgefiihrt worden 
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ist, der gesamte Prozefi invertierbar, indem die inversen 
Rotationen in umgekehrter Reihenfolge ausgefuhrt werden. 
Erf indungsgemafi existiert somit eine ganzzahlige Approxima- 
tion der MDCT mit perfekter Rekonstruktion, also eine ver« 
5 lustlose Transformation. 

Die erf indungsgemafie Transformation liefert ganzzahlige 
Ausgangswerte statt Gleitkommawerte . Sie liefert eine per- 
fekte Rekonstruktion, so daB kein Fehler eingefuhrt wird, 

10 wenn eine Vorwarts- und dann eine Ruckwartstransf ormation 
ausgefuhrt werden. Die Transformation ist gemaB einem be- 
vorzugten Ausf uhrungsbeispiel der vorliegenden Erfindung 
ein Ersatz fur die modifizierte diskrete Cosinustransf orma- 
tion. Auch andere Transf ormationsverf ahren konnen jedoch 

15 ganzzahlig ausgefuhrt werden, so lange eine Zerlegung in 
Rotationen und eine Zerlegung der Rotationen in Lifting- 
Schritte moglich ist. 

Die ganzzahlige MDCT gemafi der vorliegenden Erfindung hat 
20 die meisten gunstigen Eigenschaf ten der MDCT. Sie hat eine 
iiberlappende Struktur, wodurch eine bessere Frequenzselek- 
tivitat als bei nicht-uberlappenden Blocktransf ormationen 
erhalten wird. Aufgrund der TDAC-Funktion, die bereits beim 
Fenstern vor der Transformation berucksichtigt wird, wird 
25 eine kritische Abtastung beibehalten, so dafi die Gesamtan- 
zahl von Spektralwerten, die ein Audiosignal darstellen, 
gleich der Gesamtanzahl von Eingangs-Abtastwerten ist. 

Verglichen mit einer normalen MDCT, die Gleitkomma- 
30 Abtastwerte liefert, zeigt sich bei der erf indungsgemalien 
ganzzahligen Transformation, dafi lediglich in dem Spektral- 
bereich, in dem wenig Signalpegel ist, das Rauschen im Ver- 
gleich zur normalen MDCT erhoht ist, wahrend sich diese 
Rauscherhohung bei signif ikanten Signalpegeln nicht bemerk- 
35 bar macht. Dafur bietet sich die erf indungsgemafie ganzzah- 
lige Verarbeitung fur eine effiziente Hardware- 
Implementation an, da lediglich Multiplikationsschritte 
verwendet werden, die ohne weiteres in Verschieben- 
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Addieren-Schritte (Shif t/Add-Schritte) zerlegt werden kon- 
nen, welche einfach und schnell hardwaremafiig implementiert 
werden konnen. 

5 Die erf indungsgemaBe ganzzahlige Transformation liefert ei- 
ne gute spektrale Darstellung des Audiosignals und bleibt 
dennoch im Bereich der ganzen Zahlen. Wenn sie auf tonale 
Teile eines Audiosignals angewandt wird, resultiert dies in 
einer guten Energiekonzentrierung . Damit kann ein effizien- 

10 tes verlustloses Codierschema aufgebaut werden, indem ein- 
fach die in Fig. 1 dargestellte erf indungsgemafce Fenste- 
rung/Transformation mit einem Entropiecodierer kaskadiert 
wird. Insbesondere ein gestapeltes Codieren (Stacked Co- 
ding) unter Verwendung von Escape-Werten, wie es in MPEG 

15 AAC eingesetzt wird, ist fur die vorliegende Erfindung giin- 
stig. Es wird bevorzugt, alle Werte um eine bestimmte Po- 
tenz von zwei herunterzuskalieren, bis sie in eine er- 
wiinschte Codetabelle passen, und dann die weggelassenen 
niederstwertigen Bits zusatzlich zu codieren. Im Vergleich 

20 zu der Alternative der Verwendung von groBeren Codetabellen 
ist die beschriebene Alternative hinsichtlich des Speicher- 
verbrauchs zum Speichern der Codetabellen gunstiger. Ein 
nahezu verlustloser Codierer konnte auch dadurch erhalten 
werden, daB einfach bestimmte der niederstwertigen Bits 

25 weggelassen werden* 

Insbesondere fur tonale Signale ermoglicht eine Entropie- 
Codierung der ganzzahligen Spektralwerte einen hohen Co- 
diergewinn. Fur transiente Teile des Signals ist der Co- 

30 diergewinn niedrig, und zwar aufgrund des flachen Spektrums 
transienter Signale, d. h. aufgrund einer geringen Anzahl 
von Spektralwerten, die gleich oder nahezu 0 sind. Wie es 
in J. Herre, J. D. Johnston: "Enhancing the Performance of 
Perceptual Audio Coders by Using Temporal Noise Shaping 

35 (TNS) * 101. AES Convention, Los Angeles, 1996, Preprint 
4384, beschrieben ist, kann diese Flachheit jedoch verwen- 
det werden, indem eine lineare Pradiktion im Frequenzbe- 
reich verwendet wird. Eine Alternative ist eine Pradiktion 
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mit offener Schleife. Eine andere Alternative ist der Pra- 
diktor mit geschlossener Schleife. Die erste Alternative, 
d. h. der Pradiktor mit offener Schleife, wird TNS genannt . 
Die Quantisierung nach der Pradiktion fuhrt zu einer Adap- 
5 tion des resultierenden Quantisierungsrauschens an die 
zeitliche Struktur des Audiosignals und verhindert daher 
Vorechos in psychoakustischen Audiocodierern . Fur ein ver- 
lustloses Audiocodieren ist die zweite Alternative, d. h. 
mit einem Pradiktor mit geschlossener Schleife, geeigneter, 

10 da die Pradiktion mit geschlossener Schleife eine genaue 
Rekonstruktion des Eingangssignals erlaubt. Wenn diese 
Technik auf ein erf indungsgemaJi erzeugtes Spektrum angewen- 
det wird, mufi ein Rundungsschritt nach jedem Schritt des 
Pradiktionsf ilters durchgefuhrt werden, urn im Bereich der 

15 Ganzzahlen zu bleiben. Durch Verwenden des inversen Filters 
und derselben Rundungsf unkt ion kann das ursprungliche Spek- 
trum genau wieder hergestellt werden. 

Um die Redundanz zwischen zwei Kanalen zur Datenreduktion 
20 auszunutzen, kann auch eine Mitte-Seite-Codierung verlust- 
los eingesetzt werden, wenn eine gerundete Rotation mit ei- 
nem Winkel n/4 verwendet wird. Im Vergleich zur Alternative 
des Berechnens der Summe und Differenz des linken und rech- 
ten Kanals eines Stereos ignals hat die gerundete Rotation 
25 den Vorteil der Energieerhaltung. Die Verwendung sogenann- 
ter Joint-Stereo-Codiertechniken kann fur jedes Band ein- 
oder ausgeschaltet werden, wie es auch im Standard MPEG AAC 
durchgefuhrt wird. Weitere Drehwinkel konnen ebenfalls be- 
riicksichtigt werden, um eine Redundanz zwischen zwei Kana- 
30 len flexibler reduzieren zu konnen. 
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Patentanspriiche 

1. Verfahren zum Verarbeiten von zeitdiskreten Abtastwer- 
ten, die ein Audiosignal darstellen, urn ganzzahlige 
5 Werte zu erhalten, mit folgenden Schritten: 

Fenstern der zeitdiskreten Abtastwerte mit einem Fen- 
ster (w) mit einer Lange, die 2N zeitdiskreten Ab- 
tastwerten entspricht, um gefensterte zeitdiskrete Ab- 
10 tastwerte fur eine Umsetzung der zeitdiskreten Ab- 

tastwerte in eine spektrale Darstellung mittels einer 
. Transformation zu liefern, die aus N Eingangswerten N 
Ausgangswerte erzeugen kann, wobei das Fenstern fol- 
gende Teilschritte aufweist: 

15 

Auswahlen (16) eines zeitdiskreten Abtastwerts 
aus einem Viertel des Fensters und eines zeitdis- 
kreten Abtastwerts aus einem anderen Viertel des 
Fensters, um einen Vektor von zeitdiskreten Ab- 
20 tastwerten zu erhalten; 

Beauf schlagen des Vektors mit einer quadratischen 
Drehmatrix, deren Dimension mit der Dimension des 
Vektors ubereinstimmt, wobei die Drehmatrix durch 
25 eine Mehrzahl von Lif ting-Matrizen darstellbar 

ist, wobei eine Lifting-Matrix nur ein Element 
aufweist/ das von dem Fenster (w) abhangt und un- 
gleich 1 oder 0 ist, wobei der Teilschritt des 
Beauf schlagens folgende Unterschritte aufweist: 

30 

Multiplizieren (18) des Vektors mit einer 
Lifting-Matrix, um einen ersten Ergebnisvek- 
tor zu erhalten; 

35 Runden (20) einer Komponente des ersten Er- 

gebnisvektors mit einer Rundungsf unktion 
(r), die eine reelle Zahl auf eine ganze 
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Zahl abbildet, um einen gerundeten ersten 
Ergebnisvektor zu erhalten; und 

sequentielles Durchfuhren der Schritte des 
Multiplizierens (22) und Rundens (24) mit 
einer anderen Lif ting-Matrix, bis alle Lif- 
ting-Matrizen abgearbeitet sind, um einen 
gedrehten Vektor zu erhalten, der einen 
ganzzahligen gefensterten Abtastwert aus dem 
Viertel des Fensters und einen ganzzahligen 
gefensterten Abtastwert aus dem anderen 
Viertel des Fensters aufweist. 



2. Verfahren nach Anspruch 1, bei dem die Lifting- 
15 Matrizen 2 x 2-Matrizen sind, und bei dem insgesamt 

drei Lif ting-Matrizen pro Drehmatrix vorhanden sind. 

3. Verfahren nach Anspruch 1 oder 2, bei dem der Schritt 
des Multiplizierens des Vektors oder eines gerundeten 

20 Ergebnisvektors durch Bilden von Partialprodukten und 

Aufsummieren der Partialprodukte durchgefuhrt wird, 
wobei der Schritt des Rundens mit nicht-ganzzahligen 
Partialprodukten durchgefuhrt wird, bevor aufsummiert 
wird. 

25 

4. Verfahren nach einem der vorhergehenden Anspruche, bei 
dem das Fenster eine Anzahl 2N von Abtastwerten auf- 
weist, die gleich einer Potenz der Basis 2 ist. 

30 5. Verfahren nach einem der vorhergehenden Anspruche, bei 

dem die Drehmatrix eine Givens-Drehmatrix ist. 

6. Verfahren nach einem der vorhergehenden Schritte, das 
ferner folgenden Schritt aufweist: 



35 



Durchfuhren des Schritt des Fensters fur alle zeitdis- 
kreten Abtastwerte der verbleibenden Viertel des Fen- 
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10 

7. 



15 8. 
9. 

20 

10. 

25 



30 



sters, urn 2N gefilterte ganzzahlige Abtastwerte zu er- 
halten; und 

Umsetzen (14) von N gefensterten ganzzahligen Abtast- 
werten in eine spektrale Darstellung durch eine Ganz- 
zahl-DCT fur Werte mit den gefilterten ganzzahligen 
Abtastwerten des zweiten viertels und des dritten 
Viertels des Fensters, urn N ganzzahlige Spektralwerte 
zu erhalten . 

Verfahren nach Anspruch 6, bei dem die Ganzzahl-DCT 
eine DCT ist, die nicht-symmetrische Basisf unktionen 
auf weist . 

Verfahren nach Anspruch 7, bei dem die DCT eine Typ- 
IV-DCT ist. 

Verfahren nach einem der Anspruche 6 bis 8, bei dem 
die DCT in Givens-Rotationsmatrizen und diese wiederum 
in Lifting-Matrizen zerlegbar ist, wobei nach jeder 
Multiplikation mit einer Lifting-Matrix ein Rundungs- 
schritt folgt. 

Verfahren nach einem der vorhergehenden Anspruche, bei 
dem die Givens-Drehmatrix folgende Gestalt hat: 



bei dem die Lifting-Matrizen folgende Gestalt haben: 



bei dem der Winkel a f olgendermalien definiert ist: 
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a - arctan[w(N/2-l-k) / w(N/2 + k) ] 

wobei k ein Zeitindex der zeitdiskreten Abtastwerte 
ist und von 0 bis 2N-1 lauft und wobei w eine Fenster- 
funktion ist. 

11. Verfahren nach einem der vorhergehenden Anspriiche, bei 
dem fur die Fenster f unktion w folgende Bedingung er- 
fullt ist: 



12. Verfahren nach Anspruch 11, bei dem das Fenster ein 
Sinusfenster ist. 

13. Verfahren nach einem der vorhergehenden Anspruche, bei 
dem die zeitdiskreten Abtastwerte ganzzahlig sind. 

« 

14. Verfahren nach Anspruch 6, das ferner folgenden 
Schritt aufweist: 

Entropie-Codieren der ganzzahligen Spektralwerte, um 
eine Entropie-codierte Version des Audiosignals zu er- 
halten. 

15. Verfahren nach Anspruch 6, das ferner den Schritt des 
Quantisierens der ganzzahligen Spektralwerte unter Be- 
rucksichtigung der psychoakustischen Maskierungs- 
schwelle aufweist, um quantisierte Spektralwerte zu 
erhalten, die so quantisiert sind, daB das Quantisie- 
rungsrauschen im wesentlichen maskiert ist. 

16. Verfahren nach Anspruch 6, das ferner den Schritt des 
Filterns der ganzzahligen Spektralwerte uber der Fre- 



02103664A1_I_> 



WO 02/103684 



25 



PCT/EP02/05865 



quenz mittels eines Pradiktors mit geschlossener 
Schleife und das Runden von Pradiktionsf ehlerwerten 
auf weist . 



5 17. Verfahren zum Invers-Verarbeiten von ganzzahligen Wer- 

ten, die durch das Verfahren nach Anspruch 1 erzeugt 
worden sind, mit folgenden Schritten: 

Beauf schlagen des gedrehten Vektors mit einer zu der 
10 Drehmatrix inversen Drehmatrix, wobei die inverse 

Drehmatrix durch eine Mehrzahl von Invers-Lif ting- 
Matrizen darstellbar ist, wobei eine Invers-Lif ting- 
Matrix nur ein Element aufweist, das von dem Fenster 
abhangt und ungleich 1 oder 0 ist, wobei der Schritt 
15 des Beauf schlagens folgende Teilschritte aufweist: 

Multiplizieren des gedrehten Vektors mit einer 
Invers-Lif ting-Matrix, die zu der Lifting-Matrix 
invers ist, die beim Erzeugen der ganzzahligen 
20 Werte zuletzt verwendet worden ist, um einen er- 

sten Invers-Ergebnisvektor zu erhalten; 

Runden einer Komponente des ersten Invers- 
Ergebnisvektors mit der Rundungsf unktion, um ei- 
25 nen gerundeten ersten Invers-Ergebnisvektor zu 

erhalten; und 



sequentielles Durchfiihren der Schritte des Multi- 
plizierens und Rundens mit weiteren Lifting- 

30 Matrizen in einer Reihenfolge, die beziiglich der 

Reihenf olge beim Erzeugen der ganzzahligen Werte 
umgekehrt ist, um einen invers verarbeiteten Vek- 
tor zu erhalten, der einen ganzzahligen zeitdis- 
kreten Abtastwert aus einem Viertel des Fensters 

35 und einen ganzzahligen zeitdiskreten Abtastwert 

aus einem anderen Viertel des Fensters umfassen. 
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18. Verfahren nach Anspruch 17, bei dem die ganzzahligen 
Werte durch das Verfahren nach Anspruch 2 erzeugt sind 
und ganzzahlige Spektralwerte umfassen, und bei dem 
ferner vor dem Schritt des Beauf schlagens des gedreh- 

5 ten Vektors folgender Schritt ausgefuhrt wird: 

Umsetzen der ganzzahligen Spektralwerte durch eine zu 
der Ganzzahl-DCT beim Erzeugen inverse Ganzzahl-DCT in 
eine zeitliche Darstellung, urn den gedrehten Vektor zu 
10 erhalten. 

19. Verfahren nach Anspruch 17 oder 18 , bei dem die Run- 
dungsf unktion punktsymmetrisch ist, und bei dem die 
Invers-Lif ting-Matrizen identisch zu den Lifting- 

15 Matrizen sind, jedoch mit einem negativen Drehwinkel. 

20. Verfahren nach Anspruch 18/ 

bei dem die Ganzzahl-DCT eine von einer DCT vom Typ IV 
20 abgeleitete DCT ist. 

21. Verfahren nach einem der Anspruche 17 bis 20, bei dem 
die Invers-Lif ting-Matrizen identisch zu den entspre- 
chenden Lif ting-Matrizen sind, jedoch abgesehen von 

25 Nebendiagonal-Elementen, die im Vergleich zu den Lif- 

ting-Matrizen bei den Invers-Lif ting-Matrizen negativ 
sind. 

22. Vorrichtung zum Verarbeiten von zeitdiskreten Ab- 
30 tastwerten, die ein Audiosignal darstellen, urn ganz- 
zahlige Werte zu erhalten, mit folgenden Merkmalen: 

einer Einrichtung zum Fenstern der zeitdiskreten Ab- 
tastwerte mit einem Fenster (w) mit einer Lange, die 
35 2N zeitdiskreten Abtastwerten entspricht, urn gefen- 

sterte zeitdiskrete Abtastwerte fur eine Umsetzung der 
zeitdiskreten Abtastwerte in eine spektrale Darstel- 
lung mittels einer Transformation zu liefern, die aus 
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10 



N Eingangswerten N Ausgangswerte erzeugen kann, wobei 
die Einrichtung zum Fenstern folgende Teilmerkmale 
auf weist : 

eine Einrichtung zum Auswahlen (16) eines 
zeitdiskreten Abtastwerts aus einem Viertel des 
Fensters und eines zeitdiskreten Abtastwerts aus 
einem anderen Viertel des Fensters, um einen Vek- 
tor von zeitdiskreten Abtastwerten zu erhalten; 



eine Einrichtung zum Beauf schlagen des Vektors 
mit einer quadratischen Drehmatrix, deren Dimen- 
sion mit der Dimension des Vektors iibereinstimmt , 
wobei die Drehmatrix durch eine Mehrzahl von Lif- 
15 ting-Matrizen darstellbar ist, wobei eine Lif- 

ting-Matrix nur ein Element aufweist, das von dem 
Fenster (w) abhangt und ungleich 1 Oder 0 ist, 
wobei die Einrichtung zum Beauf schlagen folgende 
Untermerkmale auf weist : 

20 

eine Einrichtung zum Multiplizieren (18) des 
Vektors mit einer Lifting-Matrix, um einen 
ersten Ergebnisvektor zu erhalten; 

25 eine Einrichtung zum Runden (20) einer Kom- 

ponente des ersten Ergebnisvektors mit einer 
Rundungsf unktion (r) , die eine reelle Zahl 
auf eine ganze Zahl abbildet, um einen ge- 
rundeten ersten Ergebnisvektor zu erhalten; 

30 und 

eine Einrichtung zum sequentiellen Durchfiih- 
ren der Schritte des Multiplizierens (22) 
und Rundens (24) mit einer anderen Lifting- 
35 Matrix, bis alle Lif ting-Matrizen abgearbei- 

tet sind, um einen gedrehten Vektor zu er- 
halten, der einen ganzzahligen gefensterten 
Abtastwert aus dem Viertel des Fensters und 
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einen ganzzahligen gefensterten Abtastwert 
aus dem anderen Viertel des Fensters auf- 
weist . 

23. Vorrichtung zum Invers-Verarbeiten von ganzzahligen 
Werten, die durch die Vorrichtung nach Anspruch 22 er- 
zeugt worden sind, mit folgenden Merkmalen: 

einer Einrichtung zum Beauf schlagen des gedrehten Vek- 
tors mit einer zu der Drehmatrix inversen Drehmatrix, 
wobei die inverse Drehmatrix durch eine Mehrzahl von 
Invers-Lif ting-Matrizen darstellbar ist, wobei eine 
Invers-Lifting-Matrix nur ein Element aufweist, das 
von dem Fenster abhangt und ungleich 1 oder 0 ist, wo- 
bei die Einrichtung zum Beauf schlagen folgende Teil- 
merkmale aufweist : 

eine Einrichtung zum Multiplizieren des gedrehten 
Vektors mit einer Invers-Lifting-Matrix, die zu 
der Lifting-Matrix invers ist, die beim Erzeugen 
der ganzzahligen Werte zuletzt verwendet worden 
ist, urn einen ersten Invers-Ergebnisvektor zu er- 
halten; 

eine Einrichtung zum Runden einer Komponente des 
ersten Invers-Ergebnisvektors mit der Rundungs- 
funktion, um einen gerundeten ersten Invers- 
Ergebnisvektor zu erhalten; und 

eine Einrichtung zum sequentiellen Durchfuhren 
des Multiplizierens und Rundens mit weiteren Lif- 
ting-Matrizen in einer Reihenfolge, die bezuglich 
der Reihenfolge beim Erzeugen der ganzzahligen 
Werte umgekehrt ist, um einen invers verarbeite- 
ten Vektor zu erhalten, der einen ganzzahligen 
zeitdiskreten Abtastwert aus einem Viertel des 
Fensters und einen ganzzahligen zeitdiskreten Ab- 
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tastwert aus einem anderen Viertel des Fensters 
umf assen . 
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